Hva vi ønsker å gjøre, hvordan, hvilke data, innhentingsmetoder, utvikling i oppgaven underveis. Slettelinje??
Vi ønsker å undersøke om prisutviklingen på bitcoin er relatert til kursene på verdens aksjemarkeder. Vi har hentet daglig data for bitcoin i USD (BTC/USD) og s&p500 så langt bak i tid som mulig. BTC kan kjøpes og selges hele uka, også i helgene, mens børsnoterte aksjer kun handles mandag-fredag måtte vi vurdere om vi kunne kutte ut helge dataen. Stolpediagrammet nedenfor viser gjennomsnitts- og median-pris for bitcoin fordelt på de ulike ukedagene. Ettersom forskjellene er minimale har vi valgt å fjerne observasjoner lørdager og søndager slik at vi kan “matche” datasettene. I en større oppgave vil det være nødvendig å foreta en hypotesetest om prisen for bitcoin i helgene er signifikant forskjellig fra ukedagene. En alternativ løsning kunne vært å omgjøre prisene og aksjekursene til ukentlig data.
Vi har valgt den amerikanske indeksen S&P 500 og den kinesiske indeksen Shanghai Composite. Disse er vide indekser som favner om mange bransjer, vi diversifiserer dermed bort noe usystematisk risiko som ville gitt bransjemessig støy på dataen.
I vår analyse ønsker vi også å inludere viktige innsatsfaktorer i øknomien, og vi har dermed inkludert olje prisen (WTI) og kapital representert med statobligasjonrentene på de obligasjonene med kortest løpetid, USA 3 month treasury bonds og Kinesiske 1 Year bonds. Disse to rente blir brukt som mål på renten for risikofri kapital i sine respektive marked. Endringe i risikofri rente er viktig for finansmarkedne fordi det inngår i kalkulasjon av avkasningkravet WACC. Hvis renten går opp må avkastningskravet også gå opp. (Langli 2016)
Dra inn flere prediktorvariabler som olje og statsobligasjonsrenter for å gjennomføre en multippel regresjonsanalyse på aksjeindeksene. SL???
## Date BTC
## Min. :2012-02-02 Min. : 0.0
## 1st Qu.:2013-10-09 1st Qu.: 138.6
## Median :2015-06-18 Median : 438.7
## Mean :2015-06-22 Mean : 1857.0
## 3rd Qu.:2017-03-09 3rd Qu.: 1125.3
## Max. :2018-11-14 Max. :19187.0
## # A tibble: 4 x 2
## Date BTC
## <date> <dbl>
## 1 2016-08-03 0
## 2 2016-08-04 0
## 3 2016-08-05 0
## 4 2016-08-06 0
Ved et kall på summary() av dataen ser vi at minimumsprisen på bitcoin er 0. Ved filtrering for 0 viser det seg at datasettet har prisen 0 fire sammenhengende dager. Vi mener at verdien 0 ikke kan stemme og at dataen dermed er manglende. Datasettet filtreres slik at alle verdier er høyere enn 0.
## # A tibble: 7 x 3
## day mean median
## <fct> <dbl> <dbl>
## 1 <NA> 1852. 442.
## 2 <NA> 1861. 440.
## 3 <NA> 1868. 440.
## 4 <NA> 1859. 434.
## 5 <NA> 1852. 432.
## 6 <NA> 1863. 436.
## 7 <NA> 1865. 443.
## Date SP
## Min. :1970-11-27 Min. : 62.28
## 1st Qu.:1982-11-22 1st Qu.: 139.06
## Median :1994-11-10 Median : 469.50
## Mean :1994-11-19 Mean : 785.48
## 3rd Qu.:2006-11-16 3rd Qu.:1265.29
## Max. :2018-11-27 Max. :2930.75
## Date SH
## Min. :2001-11-08 Min. :1012
## 1st Qu.:2006-03-02 1st Qu.:1668
## Median :2010-05-31 Median :2397
## Mean :2010-06-02 Mean :2490
## 3rd Qu.:2014-09-06 3rd Qu.:3090
## Max. :2018-12-07 Max. :6092
## # A tibble: 6 x 4
## Date BTC index value
## <date> <dbl> <chr> <dbl>
## 1 2012-02-02 6.1 SP 1326.
## 2 2012-02-03 6 SP 1345.
## 3 2012-02-06 5.4 SP 1344.
## 4 2012-02-07 5.7 SP 1347.
## 5 2012-02-08 5.6 SP 1350.
## 6 2012-02-09 5.8 SP 1352.
## # A tibble: 6 x 4
## Date BTC index value
## <date> <dbl> <chr> <dbl>
## 1 2018-11-07 6573. SH 2641.
## 2 2018-11-08 6480. SH 2636.
## 3 2018-11-09 6420. SH 2599.
## 4 2018-11-12 6447. SH 2631.
## 5 2018-11-13 6464. SH 2655.
## 6 2018-11-14 6359. SH 2632.
For S&P 500: Vi ser at variablene er relaterte, men at forholdet ikke er lineært. En lineær modell vil derfor ikke passe for tidsintervallet. S&P 500 mot log(BTC) gir en mye bedre fit. Vi kan tranformere observasjonene for bitcoin og lage en lineær modell for S&P som utrykk av logaritmeverdiene av bitcoin. I enkelte ggplot-grafer er en svært lav alpha benyttet for å vise den ekstreme overplottingen i nedre venstre hjørne.
For Shanghai Composite: Ser vi at variablene ikke er relatert i like stor grad. Midtveis i dataen er det en periode hvor de ser ut til å utvikle seg i samme rettning, dette er sannsynligvis en periode i 2014 hvor begge to gikk mye opp samtidig. Dataen ser ikke ut til å passe til en linær modell da den er veldig sprett og ser ikke til å følge et spesiel korrelering.
##
## Call:
## lm(formula = SP ~ log(BTC), data = ukedager)
##
## Residuals:
## Min 1Q Median 3Q Max
## -458.80 -82.06 25.51 91.56 345.30
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 897.544 10.691 83.95 <2e-16 ***
## log(BTC) 192.252 1.691 113.71 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 141.7 on 1585 degrees of freedom
## Multiple R-squared: 0.8908, Adjusted R-squared: 0.8907
## F-statistic: 1.293e+04 on 1 and 1585 DF, p-value: < 2.2e-16
##
## Call:
## lm(formula = SH ~ log(BTC), data = ukedager)
##
## Residuals:
## Min 1Q Median 3Q Max
## -890.17 -418.96 26.66 233.07 2427.46
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2051.507 42.579 48.18 <2e-16 ***
## log(BTC) 126.462 6.734 18.78 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 564.1 on 1585 degrees of freedom
## Multiple R-squared: 0.182, Adjusted R-squared: 0.1815
## F-statistic: 352.7 on 1 and 1585 DF, p-value: < 2.2e-16
## [1] 0.9438229
Begge indeksene har positive regresjonslinjer. Vi ser at forholdet er sterkere for S&P 500 enn Shangai Composite siden punktene ligger tettere rundt regresjonslinja. Det innebærer at summen av kvadratene blir mindre og at modellene har en bedre fit.
For S&P: Positiv korrelasjon innebærer at når den ene variabelen øker, øker også den andre. Styrken i forholdet er lik korrelasjonskoeffisienten, som er 0.94. Korrelasjonen er svært sterk og ikke langt unna perfekt. Ved perfekt korrelasjon er koeffisienten?? lik 1.
Hva sier regresjonsmodellen? R-squared er 0.89. 89% av variasjon i S&P 500 kan forklares av variasjon i log(BTC). For lineære modeller med kun en uavhengig variabel er verdien lik korrelasjonskoeffesienten opphøyet i 2.
For Shanghai: Forholdet er ikke like tydelig. En stor mengde observasjoner viser til store endringer i den kinesiske indeksen for de samme verdiene av log(BTC). Observasjonene svekker forholdet for den resterende dataen som følger trenden. I funksjon summary ser vi at R-squared er 0.182 det betyr at modellen har en veldig svak positiv korrelasjon, siden korrelasjon er er oppgitt fra -1 til 1 og beløpet er positivt men nært null.
Vi er interessert i å se hvordan forholdet og korrelasjonen mellom indeksene og log av BTC har utviklet seg over tid. Legger dermed til farge for ulike år for å vise utvikling i korrelasjon over tid.
For USA: I den andre grafen har hvert år fått en regresjonslinje fra egen lineær modell. Fra grafen ser vi at regresjonslinjene har negativt stigningstall i to årstall, 2014 og 2018. Begge de to årene opplevde bitcoin at “bobla sprakk”, uten at børsindeksene falt.
For Kina: Vi ser at spredningen i data og avstanden fra regresjnslinjen tyder på veldig stor volatilitet, noe som stemmer overrens med virkeligheten. Shanghai børsen nådde klimax i 2015 og har siden synket over 50%. Stort sette alle datapunktene for 2015 ligger overnfor regresjonslinjen, og i 2018 ser vi at flesteparten av dataen ligger under linjen noe som stemmer overrens med at Bitcoin har falt veldig i verdi i 2018.
Vi har benyttet 200 dagers glidende korrelasjon. Korrelasjonen på 200 dager flyttes mot høyre. Enhver observasjonen er et resultat av de siste 200 dagene. De 200 første observasjonene “forsvinner” dermed da de ikke har en verdi.
## [1] 0.421458
## [1] 0.421458
For USA: Korrelasjonen varierer sterkt i løpet av bitcoins levetid. Med 200-dagers glidende korrelasjon blir utviklingen jevnere enn ved f.eks 100- eller 50- dagers intervaller. Grafen viser at korrelasjonen mellom den amerikanske indeksen og bitcoin har vært svært høy over to lengre perioder (2013 til midten av 2014 og 2017 til midten av 2018). I perioden mellom var den glidende korrelasjonen ned mot -0.7. I denne perioden var det stor nedgang i prisen på bitcoin, mens den amerikanske børsindeksen fortsatte å øke. I andre halvdel av 2018 sank korrelasjonen igjen ned til -0.5. Gjennomsnittet for 200-dagers korrelasjonene er likevel positivt og ligger på 0.42.
Grafen viser den samme utviklingen som de fargerike regresjonslinjene fra forrige figur. I 2014 og 2018 synker korrelasjonen, i 2015 er den positiv, men svak. De resterende årene er korrelasjon positiv og sterk.
## [1] 0.4266502
## [1] -0.05814605
For Kina: Den kinesiske glidene korrelasjon skille seg fra den Amerikanske ved at den er mye mer negativ. Dette må nok ses i sammenheng med utviklingen i markede. I 2015 ser vi i at korrelasjon er på nesten -1. Det er på samme tidspunkt som Shanghai børsen når sin all time high og Bitcoin er på sin bunn etter at 2014 bobblen sprakk.
Hvordan er den kinesiske glidende korrelasjon? SL? Stemmer den intuitivt med fargelinjene? SL? Hvilken situasjon forklarer topp og bunn? SL?
Den gjennomsnittlige korrelasjonen er høyere enn gjennomsnittet av den 200-dagers glidende korrelasjonen. Dette gjelder både for den amerikanske og kinesiske indeksen.
## # A tibble: 6 x 7
## Date ch1y oil us3m SH SP BTC
## <date> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 2018-11-14 2.60 56.2 2.38 2632. 2702. 6359.
## 2 2018-11-13 2.62 55.7 2.35 2655. 2722. 6464.
## 3 2018-11-12 2.66 59.9 2.36 2631. 2726. 6447.
## 4 2018-11-09 2.69 60.2 2.36 2599. 2781. 6420.
## 5 2018-11-08 2.72 60.7 2.36 2636. 2807. 6480.
## 6 2018-11-07 2.76 61.7 2.36 2641. 2814. 6573.
multifit.sp <- lm(formula = SP ~ oil + us3m + log(BTC), data = multi)
summary(multifit.sp)
##
## Call:
## lm(formula = SP ~ oil + us3m + log(BTC), data = multi)
##
## Residuals:
## Min 1Q Median 3Q Max
## -301.652 -54.135 -4.037 60.149 211.335
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1433.7085 13.7948 103.93 <2e-16 ***
## oil -3.4270 0.1068 -32.09 <2e-16 ***
## us3m 210.4993 4.9347 42.66 <2e-16 ***
## log(BTC) 126.3672 1.6660 75.85 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 87.11 on 1581 degrees of freedom
## Multiple R-squared: 0.9587, Adjusted R-squared: 0.9586
## F-statistic: 1.224e+04 on 3 and 1581 DF, p-value: < 2.2e-16
En multippel regresjonsanalyse av S&P 500 med amerikansk oljepris, rente på 3-måneders amerikanske statsobligasjoner og transformerte verdier av bitcoin som uavhengige variabler. R-squared for modellen er 0.94, dette er høyere enn ved bitcoin som eneste faktor. Når vi legger til olje og statsobligasjoner øker prediksjonsverdien til modellen med 0.05 (0.94-0.89).
S&P 500 er sterkt korrelert med BTC. Transformering av bitcoinprisen til logaritmeverdier viser en sterk og positiv korrelasjon.
##
## Call:
## lm(formula = SH ~ oil + ch1y + log(BTC), data = multi)
##
## Residuals:
## Min 1Q Median 3Q Max
## -893.6 -195.9 -57.2 118.1 2092.7
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4147.5992 59.2028 70.058 < 2e-16 ***
## oil -18.8436 0.6331 -29.766 < 2e-16 ***
## ch1y -69.4919 25.2339 -2.754 0.00596 **
## log(BTC) 32.5188 6.7827 4.794 1.78e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 384.6 on 1581 degrees of freedom
## Multiple R-squared: 0.6203, Adjusted R-squared: 0.6195
## F-statistic: 860.8 on 3 and 1581 DF, p-value: < 2.2e-16
Hva viser modellen? Endring fra enkel regresjonsmodell (kun BTC)? SL?
Multiple R-squared er mye lavere for det kinesiske markede (0.5979) enn for det amerikanske (0.9438). Detter er sannaynligvis tilfelledigheter siden det kinesiske markedet har hatt negativ utvikling etter 2015 mens det amerikanske og bitcoin har hatt en sammenfallende positiv utviling hvis man ser på perioden under et.
Svakheten i dataen skal vi illustrere videre i oppgaven ved å analysere samme data, men over ulike tidshoisonter. Bitcoin dataen er over en relativ kort tidshorisont 2012-2018, og hele perioden sammenfaller med bullmarket i USA etter finanaskrisen, det kan gjøre at dataen kan får en urelatert positiv korrelasjon.
## ch1y oil us3m BTC SP SH
## ch1y 1.00 0.41 0.16 0.31 0.16 -0.31
## oil 0.41 1.00 -0.29 -0.20 -0.57 -0.78
## us3m 0.16 -0.29 1.00 0.85 0.83 0.25
## BTC 0.31 -0.20 0.85 1.00 0.75 0.27
## SP 0.16 -0.57 0.83 0.75 1.00 0.57
## SH -0.31 -0.78 0.25 0.27 0.57 1.00
Her ser vi en korrelasjons matrix med finansmarkedene i USA og Kina og viktige innsatsfaktorer i markedene.
Vi ser at oljeprisen har negative korrelasjon på finansmarkedene både i USA og Kina. Det skjer ved at en økning i pris på en viktig innsatsfaktor (olje) prises inn markede ved å redusere akjskurser siden økt oljepris redusert fri egenkapital hos bedrifter. Aksjer representerer verdien til selskapet etter at sikkret gjeld er betalt. Derfor er fri egenkapital viktig fordi det øker selskapenes muligheter til å øke egenkapitalen eller utbetale utbytte. (Langli, 2016)
For å vurdere om disse dataen er reliable har vi tatt ut bitcoin slik at vi kan øke tidshorisonten vår fra 2012-2018 til 2001-2018
## ch1y oil us3m BTC SP SH
## ch1y 1.00 0.41 0.16 0.31 0.16 -0.31
## oil 0.41 1.00 -0.29 -0.20 -0.57 -0.78
## us3m 0.16 -0.29 1.00 0.85 0.83 0.25
## BTC 0.31 -0.20 0.85 1.00 0.75 0.27
## SP 0.16 -0.57 0.83 0.75 1.00 0.57
## SH -0.31 -0.78 0.25 0.27 0.57 1.00
Vi ser her at korrelasjonene er mye svakere når tidshorisonten øker. Differansen i korrelasjon mellom dataen har vi samlet i en differanse korrelasjon matrix.
## ch1y oil us3m SP SH
## ch1y 0.000000000 0.009531925 0.3271831 -0.3198378 -0.5729005
## oil 0.009531925 0.000000000 -0.1556721 -0.5877386 -1.0020623
## us3m 0.327183055 -0.155672143 0.0000000 0.9067217 0.3053085
## SP -0.319837788 -0.587738553 0.9067217 0.0000000 0.1233147
## SH -0.572900452 -1.002062305 0.3053085 0.1233147 0.0000000
Her ser vi differansen i korrelasjoner mellom tidsperiodene 2012-2018 og 2001-2018. Det er spesielt korrelasjon mellom oljeprisen og aksjeindeksene som viser seg å ha stor endring, hvor Shanghai har -1.002 i differanse, og SP500 har -0.5877.
Differanse matrixen kunne dessverre ikke vises grafisk siden enkelte differanser i korrelasjon var større enn 1 eller -1 og korrelasjoner kan kun utrykkes innenfor det intervallet.
Ut fra dataen tyder det på at det amrikanske markedet er tetter knyttet opp mot bitcoin. USA er også verdens største øknomi og USAs BNP er 40% større en Kinas. Da er det kanskje ikke så unaturlig at utvillingen i det amerikanske markede påvirker Bitcoin mer enn Kinas.
Utfordringen i vår analyse er tidshorisont. Datasette til bitcoin strekker seg tilbake til 2012, fordi det var da bitcoin startet å bli handlet i organiserte marked.
Sterk korrelasjon er ikke en indikator på årsakssammenhen eller kausalitet.
Langli J. (2016) Årsregnskapet 10. utg, ISBN/EAN: 9788205494510 Gyldendal Oslo
BTC/USD https://www.bitfinex.com/stats (Krever bruker for å laste ned data)
S&P 500
https://www.investing.com/indices/us-spx-500-historical-data
https://www.investing.com/commodities/crude-oil-historical-data
-Shanghai Composite
https://www.investing.com/indices/shanghai-composite-historical-data
-USA 3 month treasury bonds
https://www.investing.com/rates-bonds/u.s.-3-month-bond-yield
-Kina 1 year treasury bond
https://www.investing.com/rates-bonds/china-1-year-bond-yield-historical-data